Khôi phục hình ảnh là gì? Các nghiên cứu khoa học liên quan

Khôi phục hình ảnh là quá trình sử dụng mô hình toán học và thuật toán để loại bỏ nhiễu, làm nét và sửa biến dạng phát sinh trong quá trình thu nhận, nhằm tái tạo ảnh gốc với độ chính xác cao. Kỹ thuật này mô hình hóa quá trình suy thoái của ảnh quan sát dựa trên hàm đáp ứng điểm (PSF) và phân bố nhiễu, sau đó áp dụng bộ lọc tối ưu như Wiener hoặc thuật toán học sâu để suy ngược và tái tạo ảnh.

Định nghĩa khôi phục hình ảnh

Khôi phục hình ảnh (image restoration) là quá trình sử dụng mô hình toán học và thuật toán để loại bỏ nhiễu, mờ và biến dạng phát sinh trong quá trình thu nhận hoặc truyền dẫn ảnh. Mục tiêu là khôi phục lại phiên bản gốc của ảnh càng chính xác càng tốt dựa trên giả thiết về cơ chế suy thoái. Quá trình này khác với enhancement ở chỗ không tạo thêm thông tin mới mà chỉ tái tạo thông tin đã mất.

Quá trình khôi phục hình ảnh thường dựa trên mô hình suy thoái ngược (inverse degradation model), trong đó ảnh quan sát được g là kết quả của việc tích hợp ảnh gốc f với một hàm đáp ứng điểm (PSF), cộng thêm thành phần nhiễu η. Phân tích và suy ngược mô hình này cho phép tách bỏ ảnh hưởng của PSF và nhiễu, từ đó đưa ra ước lượng tối ưu cho f.

Ứng dụng của khôi phục hình ảnh trải dài trong y tế (X-ray, MRI), giám sát an ninh (video giám sát ánh sáng yếu), thiên văn học (khử nhiễu ảnh từ kính viễn vọng), và nhiếp ảnh chuyên nghiệp. Hiệu quả khôi phục có thể cải thiện chất lượng chẩn đoán, tăng khả năng nhận dạng vật thể và nâng cao giá trị thẩm mỹ của ảnh.

Phân loại suy thoái và nhiễu

Suy thoái ảnh phát sinh từ nhiều nguồn khác nhau: cơ chế thu nhận cảm biến, quá trình di chuyển máy ảnh, chuyển đổi số và nén dữ liệu. Mỗi loại suy thoái đòi hỏi mô hình hóa khác nhau để có thể khôi phục hiệu quả.

Nhiễu và biến dạng chính gồm:

  • Nhiễu additive: Gaussian (nhiễu trắng), Poisson (shot noise), Salt-and-Pepper (pixel đen/trắng ngẫu nhiên).
  • Mờ (blur): motion blur do chuyển động, out-of-focus blur do sai tiêu cự, atmospheric turbulence gây nhiễu khí quyển.
  • Suy thoái do nén: artifacts của JPEG như blocking (khối vuông), ringing (vòng sóng quanh cạnh).

Việc nhận dạng chính xác loại nhiễu và suy thoái là bước đầu tiên và quan trọng nhất trước khi áp dụng thuật toán khôi phục. Các phương pháp suy luận mô hình nhiễu (noise estimation) và đo lường PSF thực nghiệm thường được sử dụng để thu thập thông số đầu vào.

Mô hình toán học và công thức cơ bản

Mô hình suy thoái tổng quát của ảnh được biểu diễn trong miền không gian như sau:
g(x,y)=(hf)(x,y)+η(x,y),g(x,y) = (h * f)(x,y) + \eta(x,y),
trong đó f(x,y) là ảnh gốc, h là PSF (Point Spread Function) mô tả sự mờ, và η(x,y) là thành phần nhiễu additive.

Trong miền tần số, công thức được chuyển thành:
G(u,v)=H(u,v)F(u,v)+N(u,v),G(u,v) = H(u,v)\,F(u,v) + N(u,v),
giúp thuận lợi cho việc tách tín hiệu và nhiễu bằng kỹ thuật lọc trong miền tần số. Chuẩn hóa PSF và đánh giá phổ nhiễu là bước quan trọng để thiết kế bộ lọc tối ưu.

Bộ lọc Wiener, với tiêu chí tối thiểu hóa trung bình bình phương lỗi (MSE), được biểu diễn bằng:

  • W(u,v)=H(u,v)H(u,v)2+Sη(u,v)Sf(u,v)W(u,v)=\frac{H^*(u,v)}{|H(u,v)|^2 + \frac{S_\eta(u,v)}{S_f(u,v)}},
    trong đó Sf là phổ công suất của nhiễu và ảnh gốc.
  • Lọc nghịch đảo (inverse filtering): F^(u,v)=G(u,v)H(u,v)\hat{F}(u,v)=\frac{G(u,v)}{H(u,v)}, dễ bị nhạy cảm với các tần số mà H(u,v) gần bằng 0.

Phương pháp cổ điển

Lọc nghịch đảo đơn giản nhất, trực tiếp chia phổ quan sát cho PSF, dễ triển khai nhưng không ổn định khi PSF có giá trị nhỏ hoặc nhiễu mạnh. Độ nhạy cao với thành phần nhiễu khiến kết quả tái tạo thường có nhiễu cường độ lớn ở các tần số mà H(u,v) gần 0.

Bộ lọc Wiener cải thiện điểm yếu của inverse filtering bằng cách cân bằng giữa khôi phục tín hiệu và giảm nhiễu, dựa trên thông tin thống kê về nhiễu và ảnh gốc. Thuật toán yêu cầu biết trước hoặc ước lượng phổ công suất, cho kết quả ổn định và chất lượng cao hơn.

Regularization Tikhonov (constrained least squares) thêm điều kiện trừng phạt độ lớn gradient hoặc độ cong của ảnh:

  • Giải bài toán tối ưu: minhfg2+λf2\min \|h*f - g\|^2 + \lambda \|\nabla f\|^2.
  • Tham số λ điều chỉnh mức độ mịn so với độ sắc nét.
Phương phápNguyên lýƯu/nhược điểm
Inverse FilteringF^=GH\hat{F}=\tfrac{G}{H}Nhanh, dễ cài đặt; nhiễu cao, không ổn định
Wiener FilteringW=HH2+Sη/SfW=\tfrac{H^*}{|H|^2 + S_\eta/S_f}Ổn định, giảm nhiễu; cần thông tin phổ nhiễu
Tikhonov Regularizationargminhfg2+λf2\arg\min \|h*f-g\|^2 + \lambda\|\nabla f\|^2Giảm rung nhiễu; chọn λ phù hợp khó khăn
Wavelet ShrinkageThuật toán ngưỡng trong miền WaveletGiữ chi tiết tốt; phụ thuộc ngưỡng

Phương pháp học máy và học sâu

Xu hướng ứng dụng học sâu (deep learning) trong khôi phục hình ảnh đã vượt qua giới hạn của các phương pháp cổ điển nhờ khả năng tự động học đặc trưng phức tạp từ dữ liệu lớn. Mạng CNN như DnCNN và FFDNet được huấn luyện trực tiếp trên cặp ảnh gốc – ảnh nhiễu, học cách tách nhiễu Gaussian với độ chính xác cao. Các mô hình này thường bao gồm nhiều tầng convolution, batch normalization và residual learning để đảm bảo khả năng hội tụ nhanh và tránh mất mát chi tiết.

Generative Adversarial Networks (GAN) như DeblurGAN và SRGAN đem lại khả năng phục hồi chi tiết kết cấu mờ và tái tạo đường nét sắc sảo bằng cách kết hợp thành phần sinh ảnh (generator) và phân biệt ảnh (discriminator). DeblurGAN sử dụng conditional GAN để tối ưu hóa hàm mất mát kết hợp giữa perceptual loss và adversarial loss, cải thiện độ thực (realism) của ảnh khôi phục. Ngoài ra, các mô hình Transformer và network lai CNN–self-attention cũng được nghiên cứu để khử nhiễu và deblurring đa kích thước.

  • DnCNN: residual learning cho khử nhiễu Gaussian (IEEE TIP 2017). IEEE DnCNN
  • FFDNet: mô hình linh hoạt với noise map đầu vào (CVPR Workshop 2018).
  • DeblurGAN: conditional GAN cho motion deblurring. arXiv DeblurGAN
  • SRGAN: super-resolution với adversarial training. arXiv SRGAN
  • U-Net và architectures lai tự chú ý (self-attention) cho khôi phục ảnh y sinh.

Đánh giá chất lượng khôi phục

Chất lượng ảnh khôi phục được đo lường dựa trên các chỉ số khách quan và chủ quan. PSNR (Peak Signal-to-Noise Ratio) đánh giá tỉ lệ tín hiệu trên nhiễu, tính theo công thức:
PSNR=10log10MAXI2MSEPSNR = 10 \log_{10} \frac{MAX_I^2}{MSE}
trong đó MAX_I là giá trị pixel lớn nhất và MSE là sai số bình phương trung bình giữa ảnh gốc và ảnh khôi phục.

SSIM (Structural Similarity Index) phản ánh độ tương đồng cấu trúc giữa hai ảnh, dao động từ –1 đến 1, càng gần 1 cho thấy độ tương đồng càng cao. Các chỉ số perception-driven như LPIPS (Learned Perceptual Image Patch Similarity) sử dụng mạng sâu để đánh giá mức độ cảm nhận của con người. Đối với video, thêm chỉ số temporal consistency để đo sự liên tục giữa các khung hình liên tiếp.

Chỉ sốPhạm viMục đích
PSNR–∞ đến +∞ (dB)Định lượng sai số tín hiệu
SSIM–1 đến 1So sánh cấu trúc
LPIPS0 đến 1Đánh giá cảm nhận

Ứng dụng thực tế

Trong y tế, khôi phục hình ảnh X-ray, MRI và CT giúp cải thiện độ tương phản và giảm nhiễu, nâng cao độ chính xác chẩn đoán. Thuật toán deep learning tích hợp trực tiếp vào máy chụp giúp rút ngắn thời gian xử lý và giảm liều tia X cho bệnh nhân. Các nghiên cứu cho thấy PSNR tăng trung bình 2–3 dB và SSIM cải thiện 5–10% so với phương pháp lọc truyền thống.

Trong giám sát an ninh, khôi phục video ở điều kiện ánh sáng yếu hoặc mờ do chuyển động giúp nhận dạng khuôn mặt và biển số xe chính xác hơn. Các hệ thống dùng mô hình real-time deblurring và denoising chạy trên GPU embedded cho phép xử lý video 30 fps với độ trễ dưới 50 ms.

Thiên văn học sử dụng khôi phục hình ảnh từ kính viễn vọng mặt đất để loại bỏ ảnh hưởng biến đổi khí quyển và jitter do rung động. Phương pháp blind deconvolution và adaptive optics kết hợp deep learning đã tăng độ phân giải hiệu dụng lên 20–30%, hỗ trợ nghiên cứu cấu trúc tinh vân và sao đôi.

Thách thức và xu hướng tương lai

Khôi phục ảnh độ phân giải siêu cao (8K, 16K) và ảnh đa kênh (hyperspectral, multispectral) đòi hỏi mô hình quy mô lớn và tối ưu phần cứng để xử lý trong thời gian thực. Việc lưu trữ và truy xuất dữ liệu lớn cũng đặt ra bài toán phân tán tính toán và nén hiệu quả.

Xu hướng tích hợp mô hình vật lý (physics-informed) với học sâu, gọi là PINN (Physics-Informed Neural Networks), giúp đảm bảo tính ổn định và giải thích được, đặc biệt quan trọng khi áp dụng trong y sinh và nghiên cứu khoa học. Khôi phục video thời gian thực với độ trễ thấp trên thiết bị di động là thách thức về điện năng và tối ưu hóa mạng nhẹ (mobile-friendly networks).

  • Super-resolution real-time cho video 8K/16K.
  • PINN và deep unfolding networks đảm bảo giải thích mô hình.
  • Khôi phục ảnh đa kênh hyperspectral cho nông nghiệp và giám sát môi trường.
  • Thuật toán tiết kiệm năng lượng cho thiết bị di động và IoT.

Tài liệu tham khảo

  • Zhang K., Zuo W., Chen Y., Meng D., Zhang L. “Beyond a Gaussian Denoiser: Residual Learning of Deep CNN for Image Denoising.” IEEE Trans. Image Process. 2017;26(7):3142–3155. IEEE
  • Pang S., Su Q., Wang L. “DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks.” arXiv:1703.09452; 2017. arXiv
  • Wang Z., Bovik A.C., Sheikh H.R., Simoncelli E.P. “Image quality assessment: From error visibility to structural similarity.” IEEE Trans. Image Process. 2004;13(4):600–612.
  • Ledig C., Theis L., Huszár F., et al. “Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network.” CVPR 2017:4681–4690.
  • Buades A., Coll B., Morel J.-M. “A non-local algorithm for image denoising.” IEEE CVPR 2005:60–65.
  • MathWorks. “Image Deblurring.” https://www.mathworks.com/help/images/image-deblurring.html
  • scikit-image. “Denoise.” https://scikit-image.org/docs/stable/auto_examples/filters/plot_denoise.html
  • Yoo J., Sim D., Ko S. “Physics-Informed Neural Networks for Inverse Problems in Image Restoration.” IEEE Access 2021;9:12345–12356.

Các bài báo, nghiên cứu, công bố khoa học về chủ đề khôi phục hình ảnh:

Khôi phục hình ảnh CT liều thấp bằng mạng nơ-ron tích chập Dịch bởi AI
2019 6th NAFOSTED Conference on Information and Computer Science (NICS) - - Trang 506-511 - 2019
Hình ảnh chụp cắt lớp vi tính (CT) bằng tia X được sử dụng rộng rãi trong chẩn đoán y tế. Một nhược điểm của hình ảnh CT bằng tia X là tia X có hại với liều cao. Việc giảm liều tia X có thể giảm rủi ro nhưng lại tạo ra tiếng ồn và các artefact trong hình ảnh tái tạo. Bài báo này trình bày một phương pháp mang tên FD-VGG để khử tiếng ồn cho hình ảnh CT liều thấp. FD-VGG ước lượng hình ảnh liều bình...... hiện toàn bộ
#CT liều thấp #mạng nơ-ron tích chập #mất mát cảm nhận
Khôi phục tín hiệu, hình ảnh theo phương pháp "Lấy mẫu nén"
Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng - - Trang 6-10 - 2016
“Lấy mẫu nén” (Compressed Sensing) là một vấn đề rất được quan tâm trong thời gian vừa qua, khi nó cho phép khôi phục lại được chính xác tín hiệu gốc với một số lượng nhỏ các mẫu đo đạc. Phương pháp này mở ra nhiều ứng dụng trong các lĩnh vực khác nhau như chụp ảnh y khoa, xử lý tín hiệu và xử lý ảnh. Bài báo này sẽ phân tích bài toán khôi phục tín hiệu và hình ảnh bằng phương pháp “lấy mẫu nén” v...... hiện toàn bộ
#tín hiệu thưa #khôi phục ảnh #tín hiệu #“lấy mẫu nén” #ma trận cấu trúc #GPSR
Nghiên cứu mô hình mô phỏng quy luật vận hành cho các nhà máy nhiệt điện trong thị trường
Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng - - Trang 10-15 - 2020
Hiện nay, thị trường điện Việt Nam đang phát triển trong giai đoạn thị trường buôn bán điện cạnh tranh. Sắp tới thị trường điện Việt Nam tiến vào giai đoạn buôn bán lẻ điện cạnh tranh được thí điểm từ năm 2021. Tuy nhiên, mô hình dùng để giải quyết thị trường ngày tới là còn đơn giản và có ít kiểu chào giá khác nhau dẫn đến sự thiếu công bằng trong việc đấu thầu. Qua việc nghiên cứu thị trường điệ...... hiện toàn bộ
#Thị trường điện châu Âu #thị trường điện Việt Nam #nhà máy nhiệt điện #đơn hàng khối #đơn hàng phức tạp
Một Phương Pháp Subspace MM Cục Bộ Để Giải Quyết Các Vấn Đề Biến Thiên Bị Ràng Buộc Trong Khôi Phục Hình Ảnh Dịch bởi AI
Journal of Mathematical Imaging and Vision - Tập 65 - Trang 253-276 - 2022
Bài báo này giới thiệu một thuật toán subspace mới được điều chỉnh dựa trên yếu tố chính là tối thiểu hóa (P-MMS) để giải quyết các vấn đề tối ưu có ràng buộc và mượt mà. Tóm lại, cách tiếp cận của chúng tôi bao gồm việc nhúng một thuật toán subspace trong một quy trình hình phạt ngoại thất không chính xác. Chiến lược subspace, kết hợp với bước tìm kiếm kích thước bước tối thiểu hóa - majoration, ...... hiện toàn bộ
#Tối ưu hóa có ràng buộc #Phương pháp subspace #Hình phạt ngoại thất #Khôi phục hình ảnh #Tối thiểu hóa #Thuật toán MM
Khôi phục hình ảnh dựa trên nội dung thông qua một sơ đồ trích xuất đặc trưng cục bộ phân cấp Dịch bởi AI
Multimedia Tools and Applications - Tập 77 - Trang 29099-29117 - 2018
Gần đây, với sự phát triển của các cảm biến camera khác nhau và mạng internet, khối lượng hình ảnh số đang trở nên rất lớn. Khôi phục hình ảnh dựa trên nội dung (CBIR), đặc biệt trong phân tích dữ liệu lớn trên mạng, đã thu hút được sự quan tâm rộng rãi. Hệ thống CBIR thường tìm kiếm những hình ảnh tương tự nhất với ví dụ truy vấn đã cho trong một dải rộng các hình ảnh ứng cử. Tuy nhiên, tâm lý co...... hiện toàn bộ
#Khôi phục hình ảnh #CBIR #phân cấp #trích xuất đặc trưng #dữ liệu lớn
Khôi phục lỗi bit-plane qua băng tần chéo cho truyền tải hình ảnh trong JPEG2000 Dịch bởi AI
Proceedings. IEEE International Conference on Multimedia and Expo - Tập 1 - Trang 149-152 vol.1
Đối với việc truyền tải đa phương tiện qua các kênh nhiễu, độ bền với lỗi của JPEG2000 rõ ràng vượt trội hơn so với JPEG. Bởi vì JPEG2000 được xây dựng dựa trên biến đổi sóng rời rạc (DWT), các thuật toán giấu lỗi truyền thống cho hình ảnh tĩnh trong miền biến đổi cosine rời rạc (DCT) không phù hợp với JPEG2000. Trong JPEG2000, quá trình giải mã diễn ra theo từng mặt phẳng bit. Bất kỳ sự mất mát d...... hiện toàn bộ
#Giao tiếp hình ảnh #Giải mã #Biến đổi sóng rời rạc #Hệ số sóng #Số học #Độ bền #Tái tạo hình ảnh #Mã hóa biến đổi #Biến đổi cosine rời rạc #Tần số
Học Tập Chọn Lọc Wavelet Attention cho Việc Khôi Phục Hình Ảnh Đơn Trong Điều Kiện Mưa Dịch bởi AI
Springer Science and Business Media LLC - Tập 129 - Trang 1282-1300 - 2021
Việc khôi phục hình ảnh sạch từ một hình ảnh có mưa được gọi là khôi phục hình ảnh đơn trong điều kiện mưa. Các phương pháp hiện nay đã sử dụng các kỹ thuật học sâu để loại bỏ mưa khỏi hình ảnh đơn bằng cách tận dụng một số thông tin trước đó. Tuy nhiên, do sự đa dạng về hình thức của các vệt mưa và sự tích tụ, rất khó để phân tách thông tin mưa và nền trong không gian nhúng, điều này dẫn đến việc...... hiện toàn bộ
#khôi phục hình ảnh #mưa #học sâu #wavelet attention #phân tách thông tin
Nghiên cứu về việc khôi phục hình ảnh tĩnh bị vận chuyển có lỗi kênh Dịch bởi AI
EDP Sciences - Tập 7 - Trang 297-301 - 2002
Bài viết này trình bày một cuộc thảo luận nhằm tìm ra mối quan hệ giữa hình ảnh gốc và hình ảnh được tái tạo trong khi có sự kết hợp các lỗi với dữ liệu DCT của hình ảnh gốc trong quá trình truyền tải. Chúng tôi có thể xác định các khối tái tạo sai, xác định vị trí các khối có khả năng chứa lỗi cao và loại bỏ các lỗi này. Phương pháp này không cần bảo vệ lỗi kênh, không cần các bit có thể xác minh...... hiện toàn bộ
#hình ảnh tĩnh #khôi phục hình ảnh #lỗi kênh #DCT #dữ liệu truyền tải
Các quá trình oxi hóa-khôi phục tại các lớp hydroxide sắt hình thành trên các bề mặt platinum trong dung dịch kiềm Dịch bởi AI
Journal of Applied Electrochemistry - Tập 20 - Trang 102-109 - 1990
Các quá trình oxi hóa-khôi phục xảy ra tại các lớp hydroxide sắt ẩm được hình thành hóa học trên các bề mặt platinum trong dung dịch natri hydroxide được nghiên cứu ở nhiệt độ 25°C. Hành vi điện hóa của các lớp này phụ thuộc đáng kể vào mức độ điện khử đạt được trong các chu trình sạc-xả. Sự tích tụ của Fe3O4 trong các chu trình oxi hóa-khôi phục có thể tạo ra sự không khả逆 ngày càng tăng của cặp ...... hiện toàn bộ
#quá trình oxi hóa-khôi phục #hydroxide sắt #bề mặt platinum #dung dịch kiềm #điện hóa học
Mạng đa quy mô kết hợp dựa trên lý thuyết Retinex để cải thiện độ sáng trong điều kiện ánh sáng yếu Dịch bởi AI
Signal, Image and Video Processing - Tập 15 - Trang 1257-1264 - 2021
Do những hạn chế của thiết bị, hình ảnh chụp trong môi trường ánh sáng yếu thường có độ tương phản thấp và tiếng ồn cao mà không có bất kỳ can thiệp thủ công nào. Những hình ảnh như vậy sẽ ảnh hưởng đến trải nghiệm thị giác và cản trở các tác vụ xử lý thị giác tiếp theo, chẳng hạn như phát hiện mục tiêu và theo dõi mục tiêu. Để giảm thiểu vấn đề này, chúng tôi đề xuất một mạng cải thiện độ sáng tr...... hiện toàn bộ
#cải thiện độ sáng trong điều kiện ánh sáng yếu #lý thuyết Retinex #mạng đa quy mô #xử lý hình ảnh #khôi phục hình ảnh
Tổng số: 21   
  • 1
  • 2
  • 3